AI产业链地图·知识库 Google TPU v7 Ironwood · 概念
🚧 网站建设中 更新 2026·06·17 → 产业链图谱
首页/概念/Google TPU v7 Ironwood
更新 2026·06·17
概念 技术 / 术语

Google TPU v7 Ironwood

TPU v7 · Ironwood · Google Ironwood

Ironwood 关键定位:

Google TPU v7 Iron CONCEPT · 概念
首次提出
2025
关键参与方
[[Google]] · [[Broadcom]]
反向引用
6 处 · 来自 5
归属 AI芯片GoogleTPUCSP自研推理优化第二层第三层

Google TPU v7 Ironwood

Google 第七代 TPU,代号 Ironwood,2025-04 Google Cloud Next 发布、2025-H2 GA,是首款专为"推理时代"设计的 TPU(强调推理吞吐 / 长上下文),是 Google AI 路线图对 NVIDIA Blackwell 时代的回应。

关键规格

维度 数值
发布 2025-04 公布(Google Cloud Next 2025)/ 2025-H2 GA
制程 TSMC 3nm(推测)
FP8 算力 ~4,614 TFLOPS(单芯片,行业推算)
显存 192 GB HBM3E
显存带宽 ~7.4 TB/s
互联 ICI 升级(更大 Pod 规模)
整机形态 TPU v7 Pod(9,216 颗,单 Pod 规模显著大于前代)

[!info] GA 时点口径说明(2026-05-29 核) 规格(192GB HBM3E / ~7.37 TB/s / 4,614 TFLOPS FP8 / 9,216 颗超级 Pod / 2025-04 Google Cloud Next 公布)经 Google 官方博客逐项核对吻合。GA 时点:Google 官方 2025-11 博客称"未来几周内(coming weeks)正式 GA",即实际 GA 落在 2025 年末,仍在"2025-H2"区间但偏晚(Google Cloud Blog 2025-11,T1)。

市场定位

Ironwood 关键定位:

  • 首款 "推理优先" TPU —— 对应 AI 进入推理时代(Inference-time compute scaling)的趋势
  • 单芯片 FP8 算力比 Trillium 跳跃式提升(~5×)
  • HBM3E 192GB → 长上下文 / 大批量推理优势
  • 大 Pod 规模(9,216 颗)→ 多模型并行推理友好

客户与部署

  • Google DeepMind:Gemini 2.5+ 模型推理核心算力
  • GCP 外部 —— 2025-H2 上线 Cloud TPU v7 实例
  • 路线图客户 —— 与 NVIDIA B200/B300 / AWS Trainium 2 形成"超大规模云三足鼎立"格局

演进路线

Google TPU v6 Trillium(2024)→ TPU v7 Ironwood(2025)→ TPU v8(路线图)

关键来源

关联

↑ up::2-01-核心逻辑芯片 Broadcom HBM3E ↓ down::3-01-云计算与智算平台 Google Gemini ⚔ competitor::NVIDIA B200 NVIDIA B300 AWS Trainium 2 ∈ belongs_to::2-01-核心逻辑芯片